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Abstract 



The present invention relates to a new pro sequence which permits the synthesis and secretion of 
heterologous proteins from a yeast cell, more particularly a yeast of the genus Saccharomyces cerevisiae 
The new pro sequence is derived from the Phormia terranovae insect defensin A precursor. The present 
invention relates to an expression cassette, a vector as well as a yeast cell comprising a DNA fragment 
encoding the sard pro sequence and a process for preparing heterologous proteins usinq such a Dro 
sequence. K 
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La presente invention a trait a une nouvelle sequence pro capable de promouvoir ta maturation de pre- 
curseurs de proteines heterologues et la secretion desdites proteines heterologues. a partir d'une cellule de 
levure recombinante. La nouvelle sequence pro est derivee du precurseur de la defensine A d'insecte. L'in- 
vention concerne plus particulierement une cassette d'expression, un vecteur ainsi qu'une cellule de levure 

5 contenant un fragment d'ADN codant pour ladite sequence pro et un precede de preparation de proteines he- 
terologues mettant en oeuvre une telle sequence. La presente invention est particulierement destinee a la pro- 
duction par la levure, notamment une levure du genre Saccharomyces cerevisiae (S. cerevisiae), de proteines 
heterologues presentant un interet industriel, qui seront secretees dans le milieu de culture des levures dans 
lequel elies pourront etre recuperees. 

w Les levures sont des organismes eucaryotes unicellulaires. Depuis deja de nombreuses annees. les le- 

vures et plus particulierement les levures du genre S. cerevisiae, sont couramment utilisees pour la production 
de proteines dMnteret industriel. En effet, la genetique et la biochimie de cette souche ont ete etudiees inten- 
sivement en laboratoire. 

Leur interet a titre de cellules note repose sur le fait qu'il s'agit d'organismes se multipliant rapidement 
is dans des milieux non couteux et dont la genetique peut etre facilement manipulee en utilisant les techniques 
de I'ADN recombinant. 

On a etabli que la levure est capable de secreter quelques proteines dans le milieu externe. D'une maniere 
generale, le processus de secretion est un processus complexe, qui necessite le passage de la proteine a se- 
creter. du cytoplasme dans le reticulum endoplasmique pour, en bout de course, etre secretee dans le milieu 
20 externe. 

D'une maniere generale, les proteines secretables sont exprimees sous la forme d'un precurseur conte- 
nant une sequence signal amino-terminaie. De nombreux precurseurs de proteines secretees et de proteines 
membranaires ont ete decrits dans la litterature, tant chez les procaryotes que chez les eucaryotes. 

D'une maniere generale, une sequence signal contient un grand nombre de residus d'acides amines hy- 
25 drophobes. Sa fonction est de promouvoir le passage d'un precurseur d'une proteine devant eXxe secretee, 
dans le reticulum endoplasmique. Au cours de cette etape de la secretion, la sequence signal est ciivee par 
une endopeptidase associee a la membrane, encore appelee signal pept idase, pour donner la proteine mature. 

Ainsi, pour qu'une proteine heterologue soit secretee dans la levure, elle doit etre precedee d'une sequen- 
ce signal, encore appelee sequence pre, reconnue par la levure. En general, on utilise une sequence signal 
homologue, issue d'une proteine secretable de la levure, qui va dinger la secretion de la proteine de fusion, 
sequence signal homologue-proteine heterologue mature. 

En outre, la secretion peut necessiter la presence additionnelle d'une sequence dans le precurseur de la 
proteine destinee a etre secretee, cette sequence supplemental etant appelee sequence pro. Ainsi, la pro- 
teine a secreter est exprimee sous la forme d'un precurseur pre- pro- proteine. De nombreuses proteines de 
35 levure naturellement secretees contiennent, outre la sequence pre, une sequence pro. 

Ainsi. le facteura (MFa) qui derive du gene MFa1, est une pheromone sexuelle secretee par les cellules 
haploides de S. cerevisiae de type MATa. Le facteur MFa1 est initialement synthetase sous la forme d'un pre- 
curseur pre-pro-facteura. Ledit precurseur consiste en une sequence signal ou sequence pre de 19 acides 
amines, suivie d'une sequence pro de 64 acides amines contenant trois sites de glycosylation, elle meme suivie 
40 d'une sequence Lys-Arg precedant 4 copies du facteur a separees par des peptides espaceurs contenant entre 
autre le dipeptide Lys-Arg (Kurjan et Herskowitz, Cell, 1982, 30, 933-943). 

II est connu que le systeme endogene de secretion de la levure peut etre mis en oeuvre pour permettre 
la secretion de proteines heterologues mature dans le milieu de culture. C'est un systeme particulierement 
avantageux d'un point de vue industriel, puisque la proteine heterologue peut etre recuperee directement du 
45 milieu de culture, evitant ainsi les etapes de broyage ou de cassage des cellules difficiles a maitriser et eli- 
minant les risques de degradation intracellulaire dus aux nombreuses proteases contenues dans une levure. 

Ainsi, de nombreuses publications relatent ('utilisation des sequences pre et pro du facteura codees par 
le gene MFa1 (pre MFa1, pro MFa1) t pour produire un grand nombre de proteines etrangeres a la levure, par 
exemple I'hirudine. L'hirudine est un inhibiteur tres specif ique et eff icace de la thrombine. II s'agit done d'un 
50 agent therapeutique tres tnteressant presentant une activite anticoagulante. Un certain nombre de variants 
de I'hirudine ont ete identifies et produits dans des souches de S. cerevisiae, en utilisant le procede de se- 
cretion mettant en oeuvre les sequences pre et pro MFa1, comme cela est decrit dans les demandes EPA 
0252854 et EPA 0273800 au nom de la demanderesse. 

D'autre part, Dimarcq et at. (EM BO J., 1990, 9, 2507-2515) ont recemment mis en evidence que les larves 
55 d'insecte Phormia terranovae, dans iesquelles ont ete injectees des bacteries, produisent et secretent dans 
le sang un produit bactericide anti gram+, encore appele defensine A. Ces auteurs ont publie la sequence d'un 
ADN complementaire (ADNc) codant pour un precurseur de la defensine A. Le precurseur est constitue de 94 
acides amines, dont les 40 acides amines C-terminaux correspondent a la defensine A mature. La sequence 
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(g) Nouvelle sequence pro permettant la secretion de proteines heterologues a partir d'un cellule de 
levure. 

(57) La presente invention concerne une nouvelle sequence pro permettant la synthese eUa secretion de 
proteines heterologues & partir d'une cellule de levure, plus particulierement une levure du genre 
Saccharomyces cerevisiae. La nouvelle sequence pro est derivee du precurseur de la defensine A 
d'insecte Phormia terranovae. La presente invention concerne une cassette d'expression, un vecteur 
ainsi qu'une cellule de levure comprenant un fragment d'ADN codant pour ladite sequence pro et un 
procede de preparation de proteines heterologue mettant en oeuvre une telle sequence pro. 
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pre comprend les 23 ou 28 premiers acides amines N-terminaux et montre toutes les caracteristiques d une 
sequence signal (nature hydrophobe et presence d'un site potentiei de clivage par une signal peptidase apres 
Talanine en position 23 ou ('alanine en position 28). La sequence pre est suivie d'une sequence pro de 31 ou 
26 acides amines, selon la longueur de la sequence pre, qui se termine par un dipeptide basique Lys-Arg. 
s On a maintenant trouve que la sequence pro du prtcurseur de la defensine A peut etre utihsee pour se- 

creter eff icacement des proteines heterologues dans la levure. notamment dans la levure du genre S. cerew- 

^^L'utilisation de ladite sequence pro de defensine A est notamment utile pour produire dans la levure des 

proteines heterologues presentant un interet industries comme par exemple I'hirudine ou la trophoblastine 
w d'ovin contenant, en outre, une extension N-terminale constitute par le dipeptide Ala-Pro, ladite extension 

n'ayant aucun effet sur I'activite biologique du produit (Degryse et al.. Gene, 1992, 118, 47-53). 

La presente invention a done pour objet une cassette d'expression permettant la synthese d'une proteine 

htttrologue mature, comprenant au moins un fragment d'ADN codant pour un precurseur de ladite proteine 

heterologue ; (edit precurseur comprenant: 
15 - une sequence pre fonctionnelle dans la levure, 

- la sequence pro du precurseur de la defensine Ade Phormia terranovae, un variant ou un fragment fonc- 
tionnel de celle-ci, et 

- une sequence correspondant a celle de ladite proteine heterologue sous forme mature ; 
ledit fragment d'ADN ttant sous le controle des elements necessaires a son expression. 

20 Par proteine heterologue, on entend toute proteine qui n'est pas produite naturellement par la levure, ainsi 

que toute proteine qui n'est pas produite naturellement par Phormia terranovae. 

Les proteines heterologues matures qui peuvent etre synthetisees dans un tel systeme peuvent etre cons- 
titutes par toute proteine heterologue mature native. Cependant d'une maniere alternative, une proteine he- 
terologue mature peut etre constitute par la fusion de deux ou plusieurs polypeptides d'interet, d'origine di- 

25 verse ou par une proteine heterologue mutee par rapport a la proteine heterologue native, de maniere a pre- 
senter une activite biologique amelioree ou modif iee. 

A titre d'exemple, on cite I'hirudine, notamment son variant rHV2-Lys 47 , la trophoblastine ovine compre- 
nant une extension N-terminale constitute par le dipeptide Ala-Pro ainsi que les xtnoxines, fami lie de peptides 
isolts de Xenopus laevis (Kolbe et al., J. of Biol. Chem., 1993, 268, 16458-16464). 

30 Par sequence prt, on entend une sequence prt principalement hydrophobe en nature, prtsente a I'extrt- 

mitt N-terminale de la forme prtcurseur d'une prottine destinte a etre secrttte et dont la fonction est de per- 
mettre au prtcurseur de ladite prottine d'entrer dans le chemin de secretion, en particulier dans le reticulum 
endoplasmique, d'une cellule de levure. La stquence pre est normalement clivee au cours du processus de 
secretion par une signal peptidase endogene. 

35 La stquence prt peut etre naturelle ou synthttique, htttrologue ou homoiogue a la levure, peut ttre cons- 

titute par un variant d'une sequence prt naturelle ou par un fragment fonctionnel de celle-ci. Par fragment 
fonctionnel, on entend tout fragment d'une stquence prt naturelle capable d'assurer I'entrte d'un prtcurseur 
d'une prottine secrttable dans le chemin de secrttion d'une cellule de levure. De preference, on utiiisera un 
fragment d'ADN codant pour un prtcurseur dont la stquence prt est une stquence prt homoiogue a la levure, 

40 par exemple la stquence prt du prtcurseur du facteur a (MFa1 ), de I'invertase ou de la p-glucanase 2 (BGL2) 
de S. cerevisiae. 

Une stquence pro du prtcurseur codt par le fragment d'ADN utilist dans la cassette d'expression selon 
['invention, peut avoir notamment une stquence telle que montrte dans I'identif icateur de stquence SEQ ID 
NO:1, dtbutant a I'acide amint en position +1 ou +6 et se terminant a Tacide amint +31, dans laquelle, en- 

45 semble ou stpartment, le rtsidu Xaa en position +2 est un rtsidu proline ou cysteine, le residu Xaa en position 
+6 est un rtsidu alanine ou cysttine, le rtsidu Xaa en position +9 est un rtsidu alanine cysttine ou threonine, 
le rtsidu Xaa en position +17 est un rtsidu alanine ou cysttine, le rtsidu Xaa en position +28 est un rtsidu 
arginine ou proline et le rtsidu Xaa en position +30 est un rtsidu arginine ou lysine. 

On prefere notamment mettre en oeuvre la stquence pro native du prtcurseur de la defensine Ade Phor- 

50 mia terranovae, telle que montrte dans I'identif icateur de stquence SEQ ID NO: 2. 

Un variant de la stquence pro, peut comporter plusieurs mutations par rapport a la stquence pro native 
du prtcurseur de la defensine A de Phormia terranovae, notamment la substitution, r addition ou la dtlttion 
d'un ou plusieurs acides amints, a la condition qu'un tel variant soit capable de diriger un prtcurseur d'une 
prottine htttrologue secrttable du rtticulum endoplasmique a I'appareil de Golgi puis de permettre la secre- 

55 tion de ladite prottine htttrologue dans le milieu de culture d'une cellule de levure. On cite plus particuliere- 
ment les variants comprenant un residu cysttine aux positions +2, +6, +9 ou +17 et/ou un rtsidu proline en 
position +29. 

De maniere plus particulitre, une stquence pro a notamment une stquence dont le degrt d'homologie 
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avec la sequence pro native du precurseur de la defensine A de Phormia terranovae est superieur a 80%, de 
manure avantageuse superieur a 90% et de preference superieur a 95%. 

Au cours du processus de secretion, la sequence pro est divee par une endoprotease, laquelle reconnait 
a I'extremite 3' de ladite sequence pro, une sequence cible constitute par un dipeptide basique de type Lys- 
Arg ou Arg-Arg et dive apres ladite sequence cible, liberant ainsi la proteine heterologue mature. L endopro- 
tease peut etre homologue ou h6rerologue a la levure, peut etre const it uee par un variant ou un fragment fonc- 
tionnel de celle-ci. Par endoprotease, on entend toute endoprotease capable de reconnait re et diver apres 
une sequence cible situee a I'extremite 3* de ladite sequence pro. notamment apres un dipeptide basique Lys- 
Arg ou Arg-Arg. On peut citer, par exemple, le produit de tout ou partie du gene KEX2 de S. cerevisiae ou une 
endoprotease heterologue exprimee dans la cellule de levure, comme la f urine des cellules de mammif&res. 

Ainsi la sequence pro comporte a son extremity 3' un dipeptide basique Lys-Arg ou Arg-Arg permettant 
de diver la sequence pro de la proteine a secrete r probablement dans I'appareil de Goigi, lib era nt ainsi la forme 
mature de ladite proteine. 

Selon un mode pre fere, la sequence pro a la sequence en acides amines telle que montree dans I'identi- 
ficateur de sequence SEQ ID NO:1, debutant a I'acide amine en position +1 ou +6 et se terminant a I'acide 
amine +31, dans laquelle le residu Xaa en position +2 est un residu proline, le residu Xaa en position +6 est 
un residu alanine, le residu Xaa en position +9 est un residu alanine ou threonine, le residu Xaa en position 
+17 est un residu alanine, le residu Xaa en position +28 est un residu arginine et le residu Xaa en position 
+30 est un residu arginine ou lysine. 

Ainsi, la sequence pro est avantageusement choisie parmi : 

(1) la sequence pro du precurseur de la d6fensine A de Phormia terranovae, debutant a I'acide amine en 
position +1 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
alanine et le residu Xaa en position +30 est un residu arginine. 

(2) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +1 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
threonine et le residu Xaa en position +30 est un residu arginine. 

(3) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +1 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
alanine et le residu Xaa en position +30 est un residu lysine. 

(4) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +1 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
threonine et le residu Xaa en position +30 est un residu lysine. 

(5) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +6 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
alanine et le residu Xaa en position +30 est un residu arginine. 

(6) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +6 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
threonine et te residu Xaa en position +30 est un residu arginine. 

(7) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +6 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
alanine et le residu Xaa en position +30 est un residu lysine. 

(8) la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine en 
position +6 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un r6sidu 
threonine et le r6sidu Xaa en position +30 est un residu lysine. 

Par elements necessaires a ('expression du fragment d'ADN codant pour un precurseur d'une proteine 
heterologue, on entend I'ensemble des elements permettant la transcription dudit fragment d'ADN en ARN 
messager (ARNm) et la traduction de I'ARNm en proteine. 

La cassette d'expression selon Tinvention, comporte notamment un promoteur fonctionnel dans une cel- 
lule de levure. De tels promoteurs sont bien connus de I'homme de Tart et sont inseres dans la cassette d'ex- 
pression en amont du fragment d'ADN a transcrire, par les techniques conventionnelles du genie genetique. 
On citera, par exemple, les promoteurs du gene PGK (phosphoglycerate kinase), du gene MFp1 et du g6ne 
ADH (atcool-dehydrogenase) de levure. 

Une cassette d'expression selon I'invention, presentant un interet particulier, est celle qui associe un frag- 
ment d'ADN codant pour un precurseur de I'hirudine, comportant la sequence pre du precurseur du facteura 
de la levure, la sequence pro du precurseur de la defensine A de Phormia terranovae, debutant a I'acide amine 
en position +1 et se terminant a I'acide amine +31, dans laquelle le residu Xaa en position +9 est un residu 
alanine et le residu Xaa en position +30 est un residu lysine et la sequence correspondant a celle du variant 
rHV2-Lys 47 de I'hirudine, ledit fragment d'ADN etant sous le contrdle du promoteur du gene MFa1 de la levure. 
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Enfin, la cassette d' expression selon (Invention peut comprendre, en outre, un terminateur de transcrip- 
tion fonctionnel dans la levure, par exemple, une sequence de terminateur du gene PGK. 

La cassette d'expression selon I'invention peut etre inseree dans un vecteur d'expression qui sert a trans- 
former une cellule de levure h6te. Les vecteurs d'expression selon l'invention, seront en general des plasmides 
a replication autonome. Ces plasmides peuvent com porter des elements assurant leur replication, c'est a dire 
une origine de replication, telle que cede du plasmide 2\x de levure et des elements de selection, tel le gene 
ura3 ou Ieu2 qui assure la complementation des mutants de levure ura3 ou Ieu2. En particuiier, on pourra avan- 
tageusement utiliser un gene de selection delete de son promoteur afin d'augmenter le nombre de copies de 
plasmides dans une cellule de levure. 

Ces plasmides peuvent egalement comporter des elements assurant leur replication dans Escherichia colt 
(£. colt), lorsque le plasmide doit etre un plasmide navette, par exemple, une origine de replication telle que 
celle du plasmide pBR322, un gene marqueur tel que le gene de la (31 acta mas e conferant la resistance a I'am- 
picilline et/ou d'autres elements connus de I'homme du metier. 

De maniere preferee, le vecteur d'expression selon ('invention comprend, en outre, une ou plusieurs copies 
de tout ou partie du gene KEX2 menant a une augmentation de I'activite proteolytique de I'endoprotease yscF. 
Le gene complet pourvu de son propre promoteur peut etre utilise ainsi que des fragments de ce gene, comme 
cela est decrit dans la demande EPA 396436 au nom de la demanderesse. 

L'invention s'etend egalement a une souche de levure transformee avec un vecteur d'expression selon 
I'invention ou comprenant une cassette d'expression selon l'invention integree dans son genome. Parmi toutes 
les souches de levure envisageables, on peut citer les (evures Saccharomyces cerevisiae, Hansenula poly- 
morpha, Pichia pastoris et KJuyveromyces lactis. Cependant, on utilisera de preference les souches du genre 
Saccharomyces, notammentde I'espece cerevisiae. On utilisera, par exemple, une souche de genotype ura3 
ou Ieu2 ou autre qui pourra etre complementee par le vecteur selon i'invention, pour assurer le maintien du 
vecteur dans la levure par une pression de selection appropriee. On pourra egalement utiliser une souche sur- 
productrice de I'endoprotease yscF comprenant dans son genome une ou plusieurs copies de tout ou partie 
du gene KEX2. 

L'invention a egalement trait a un procede de preparation par des I evures d'une proteine heterologue ma- 
ture, selon lequel on cultive la souche de levure selon l'invention dans un milieu de culture approprie et on 
recupere la proteine heterologue mature secretee dans le milieu de culture. 

Enfin l'invention a pour objet une proteine heterologue mature obtenue par la mise en oeuvre d'un procede 
selon l'invention. 

Les exemples ci-apres permettront de mettre en evidence d'autres caracteristiques et avantages de la 
presente invention. Ces exemples seront illustres par les figures suivantes. 

La Figure 1 represente ia reconstitution du gene synthetique de la defensine A d'insecte par assemblage 
de 9 oligonucleotides. 

La Figure 2 represente le profil de chromatographie obtenu apres analyse par HPLC analytique en phase 
reverse, des surnageants de culture de A: la souche de S. cerevisiae TGY47.1 transformee par pTG6823 ; 
et B: la souche de S. cerevisiae TGY47.1 transformee par pTG6824. 

La Figure 3 represente le profil de chromatographie obtenu apres analyse par HPLC analytique en phase 
reverse, des surnageants de culture de A: la souche de S. cerevisiae TGY47.1 transformee par pTG8835 ; 
et B: la souche de S. cerevisiae TGY47.1 transformee par pTG8836. 

La Figure 4 montre la separation sur gel SDS-PAGE 12,5% des echantillons issus des cultures de 2 : la 
souche S. cerevisiae TGY47.1 non transformee ; 3: la souche S. cerevisiae TGY47.1 transformee par le plas- 
mide pTG8840 ; et 4 : la souche S. cerevisiae TGY47.1 transformee par le plasmide pTG8843. La ligne 1 
correspond aux proteines marqueur, dont le poids moleculaire en kDAest indique sur le cdte gauche de la Fi- 
gure. Le gel est colore au bleu de Coommassie. 

EXEMPLE 1: construction des vecteurs pTG6823 et pTG6824 et production de rHV2-Lys 47 dans le milieu 
de culture par une souche de levure transformee par lesdits vecteurs. 

Le gene synthetique de la defensine Ade Phormia terranovae est reconstitue en assembtant 9 oligonu- 
cleotides, comme indique dans la Figure 1. 

La partie 5' du gene de la defensine A, a laquelle ont ete rajoutes 1 5 nucleotides codant pour les 5 acides 
amines C-terminaux de la sequence pro MFa1 de levure (Ser-Leu-Asp-Lys-Arg) dont le codon codant pour la 
serine a ete modif ie pour generer en 5' un site Hind\\\, derive de I'assemblage de trois oligonucleotides decrits 
dans les SEQ ID NO: 3, 4 et 5 (bloc A sur la Figure 1). 

La partie 3* du gene de la defensine A d'insecte est obtenue par I'assemblage de six oligonucleotides de- 
crits dans les SEQ ID NO: 6 a 11 (bloc B sur la Figure 1). Les oligonucleotides reassembles sont introduits 




entre les sites Kpn\ et EcoRI du phage M13TG1 31 (Kieny et al.. Gene, 1 983, 26, 91-99). La partie 5' est ensuite 
inseree entre les sites Hind\\\ et Kpn\ du vecteur phagique precedant, generant ainsi te phage M13TG3849 
contenant le gene complet de la defensine A d'insecte 

Le fragment Hind\\\-BamH\ comprenant la sequence codant pour la Ser-Leu-Asp-Lys-Arg-defensine A est 
5 isole de M13TG3849. Parallelement, un fragment Sp/rl-H/ncflll est purifie de M13TG3868. Le phage 
M13TG3868 contient la sequence codant pour une proteine de fusion composee de la sequence pre et la se- 
quence pro MFa1 se terminant par le dipeptide Lys-Arg, suivie de la sequence correspondant a celle du variant 
rHV2-Lys 47 de I'hirudine, placee sous le contr6le du promoteur du gene de levure MFa1 . On peut signaler que 
la sequence pro MFa1 contient un site art if iciel Hind\\\ au niveau du codon codant pour la serine situee 5 acides 

w amines avant I'extremite C terminate de ladite sequence pro. De plus, le promoteur inclu dans M13TG3868 
est une version modifiee du promoteur du gene MFctl (Inokuchi et al., Mol. Cell. Biol., 1987, 7, 3185-3193). 
En effet, le promoteur est modif ie par le remplacement du site EcoRI 5* par un site Sph\ et par la destruction 
du site Bg(i\ interne par un traitement au grand fragment de I'ADN polymerase I d'E. coli. Le fragment Sph\- 
Hind\\\ de M13TG3868 contient done la sequence correspondant a la proteine de fusion suivante: sequence 

15 pre MFotl, sequence pro MFctl depourvue des 5 acides amines C-terminaux Ser-Leu-Asp-Lys-Arg, le tout 
etant sous le controle du promoteur modif ie du gene MFa1. 

Les deux fragments sont purifies sur gel et lies au vecteur M1 3mp1 8 (Gibco BRL) dans lequel le site unique 
Hind\\\ est detruit par un traitement au grand fragment de I'ADN polymerase I d'E. coli. On transforme le me- 
lange de ligation dans la souche E. coli NM522 eton identifie par digestion enzymatique un clone comprenant 

20 le promoteur modif ie du gene MFa1 en amont de la sequence pre MFa1 , de la sequence pro MFa1 se terminant 
par le dipeptide Lys-Arg suivie de la sequence synthetique codant pour la defensine A de Phormia terranovae, 
Ledit clone est designe M13TG4813. 

Le vecteur M13TG4813 est soumis a une mutagenese dirigee mettant en oeuvre roligonucleotide deer it 
dans la SEQ ID NO: 12, afin d'introduire un site Nhe\ dans la partie 3' de la sequence codant pour le peptide 

25 pre MFa1. Le phage ainsi modif ie constitue le M13TG5879. 

On isole un fragment SprjI-SamHI de M13TG5879, leditfragment contenant un bloc d'expression constitue 
du promoteur modif ie du gene MFa1, et de la sequence codant pour une proteine de fusion comprenant la 
sequence pre MFa1 , la sequence pro MFctl et la sequence de la defensine A mature. On introduit le fragment 
purifie entre les sites Sph\ et BamHI du plasmide pTG3828 (Achstetter et al., Gene, 1992, 110, 25-31), On 

30 transforme le melange de ligation dans la souche E. coli 1106. On isole un clone presentant la cartographie 
de restriction attendue qui est appele pTG5896. Ainsi, le bloc d'expression decrit ci-dessus est introduit dans 
un vecteur d'expression de la levure. 

Le vecteur M13JM21 2 est un vecteur derive de M13mp1 8 comprenant la sequence ADNc naturelle codant 
pour la defensine A et une extension de 65 pb (Dimarcq et al., EMBO J., 1990, 9, 2507-2515). A son extremite 

35 3'. I'insert ADNc contient environ 60pb correspondant a la region non codante de I'ARNm de la defensine A. 
De plus, I'insert ADNc est muni a ses deux extremites de linkers EcoRI. Le vecteur M13JM212 est soumis a 
une mutagenese dirigee mettant en oeuvre roligonucleotide decrit dans la SEQ ID NO: 13. La sequence de 
I'ADNc est modifiee de maniere a introduire un site de restriction Hind\\\ donnant lieu au vecteur M1 3TG5824. 
On reconstitue la sequence d'ADN codant pour la "version courte" de la sequence pro de la defensine A, 

40 debutant a I'acide amine +6 et se terminant a I'acide amine +31 de la SEQ ID NO: 2, ceci en mettant en oeuvre 
deux oligonucleotides synthetiques decrits dans les SEQ ID NO: 14 et 15. Une fois reassembles, ces oligo- 
nucleotides forment un fragment Nhe\-Afl\\. Le fragment synthetique inclut la jonction avec la sequence pre 
MFa1 ainsi que la jonction avec la sequence codant pour la defensine A mature. 

Le fragment synthetique Nhe\-AfIU ainsi que le fragment Afl\\-Saf\ isole de M13TG5824 sont lies avec le 

45 vecteur pTG5896 digere par les enzymes Nhe\ et Sa/I. On transforme le melange de ligation dans la souche 
E. coli 1106. On identifie un clone presentant un digest de restriction correct qui est designe pTG5897. Le 
vecteur pTG5897 contient done un bloc d'expression comprenant la proteine de fusion composee de la se- 
quence pre MFa1, la sequence pro version courte du precurseurde la defensine A (acides amines +6 a +31) 
et la defensine A mature, placee sous le controle du promoteur modif ie du gene MFa1. 

so Ledit bloc d'expression est isole de pTG5897 sous la forme d'un fragment Sph\-Sal\. On introduit ledit frag- 

ment dans le vecteur M13TG3868 digere par les enzymes Sph\ et Sa/I, generant ainsi le vecteur M13TG6801 . 

Le vecteur M13TG6801 est soumis a une mutagenese dirigee afin de generer la "version longue" (acides 
amines +1 a +31) de la sequence pro du precurseur de la defensine A, en mettant en oeuvre roligonucleotide 
decrit dans la SEQ ID NO: 16. Parallelement au cours de la meme reaction, on a egalement modif ie la se- 

55 quence correspondant a la jonction entre la sequence pro du precurseur de la defensine A et la sequence ma- 
ture de la defensine A. On y a introduit 5 codons comprenant un site Acc\ et codant pour les 5 acides amines 
N-terminaux de rHV2-Lys 47 , ceci en mettant en oeuvre roligonucleotide decrit dans la SEQ ID NO: 17. Le vec- 
teur M1 3TG6806 ainsi genere, code pourla sequence pre MFctl , la sequence pro du precurseurde la defensine 
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A (acides amines +1 a +31), le peptide lle-Thr-Tyr-Thr-Asp et ia defensine A mature. 

On isole du vecteur M13TG3868, un fragment Acc\~Sal\ comportant ta sequence codant pour rHV2-Lys* 7 
deletee des 5 paires de bases (pb) codant en partie pour le peptide lle-Thr N-terminal. Le fragment est introduit 
dans le vecteur M1 3TG6806 digere par Acc\ et Sa/I, donnant lieu a M1 3TG6807. qui contient le promoteur mo- 
difie du gene MFa1 precedant la proteine de fusion suivante : sequence pre MFa1, sequence pro du precur- 
seur de la defensine A (acides amines +1 a +31) et sequence du variant rHV2-Lys 47 de I'hirudine. 

Ce bloc d'expression est isole de M13TG6807 sous la forme d'un fragment Sph\-Sal\. Le fragment est in- 
sere dans le vecteur d'expression de la levure pTG3828 digere par les enzymes Sph\ et Sa/I. donnant lieu au 
vecteur pTG6823. 

Parallelement, le fragment Sph\-Sal\ isole de M13TG6807 est introduit entre les sites Sphl et Sa/I du vec- 
teur pTG4812. Le vecteur pTG4812 est derive du vecteur pTG3828. dans lequel on a introduit une copie du 
gene KEX2 de levure, ceci au niveau de la jonction de la partie 2\i et de la partie pBR322 du vecteur. On trans- 
forme le melange de ligation dans la souche E. colt NM522 et on identifie un clone presentant un prof il de 
digestion correct. Le vecteur pTG6824 ainsi genere, comprend la meme cassette d'expression de rHV2-Lys* 7 
que pTG6823 ainsi qu'une copie du gene KEX2 inseree en dehors de ladite cassette d'expression. 

On transforme les vecteurs d'expression pTG6823 et pTG6824 dans la souche S. cerevis/ae TGY47.1 
(MATa, pral, prbl, prd, cps1, ura3-delta5, leu2-3, Ieu2-112, his) ou dans la souche TGY48.1 qui derive de 
la souche TGY47.1, mais presente une prototrophie pour la leucine (Leu+). Les cellules de levure sont trans- 
formees selon la technique standard de I'acetate de lithium (Ito et al. f J. Bacteriol., 1983, 133). D'autres pro- 
tocoles de transformation de la levure peuvent egalement etre employes. Des transformants prototrophes 
Ura+ sont selectionnes sur milieu minimum (0,67% de bases azotees pour levure YNB (Yeast Nitrogen Base) 
sans acide amine, 1% de casamino acides, 2% de glucose et 2% de bacto agar). On verifie la stabilite du phe- 
notype Ura+ sur boite d'agar en milieu selectif contenant le milieu decrit ci-dessus. 

Des transformants TGY47.1/pTG6823 et TGY47.1/pTG6824 sont mis en culture en erlenmeyer a 28°C 
dans un milieu selectif (0,67% de YNB sans acide amine, 1% de casamino acides et 2% de glucose). Apres 
48h de culture, on separe cellules et surnageants parfiltration d'un aliquote de la culture sur membrane 0,22^. 
Une fraction du surnageant est soumise a une HPLC (High Pressure Liquid Chromatography) analytique en 
phase reverse dans les conditions decrites dans Achstetter et al. (Gene, 1992, 110, 25-31). On mesure I'ab- 
sorbance de I'effluent a 205nm. Les prof ils de chromatographie obtenus pour les effluents issus de la culture 
TGY47.1/pTG6823 et TGY47.1/pTG6824 sont montres dans les Figures 2A et 2B, respectivement. 

On soumet le materiel elue de la colonne et presentant un temps de retention d'environ 10,25min a un 
sequen$age des acides amines N-terminaux. Le materiel derive de la culture TGY47.1/pTG6823 montre un 
profit de chromatographie heterogene dans lequel deux types de sequences N-terminales sont lues en quan- 
tity a peu pres equivalente : 

(1) la sequence decrite dans la SEQ ID NO: 18 ou Xaa represente les acides amines qui n'ont pas pu etre 
identifies clairement. Cette sequence correspond a la sequence N-terminale attendue pour le variant ma- 
ture rHV2-Lys 47 et, 

(2) la sequence decrite dans la SEQ ID NO: 1 9 ou Xaa represente les acides amines qui n'ont pas pu etre 
identifies clairement. Ladite sequence correspond a la sequence N-terminale du rHV2-Lys 47 comprenant 
en outre une extension N-terminale de trois acides amines provenant de la sequence pro du precurseur 
de la defensine Ad'insecte. 

Par contre, avec le materiel provenant de la culture TGY47.1/pTG6824, on obtient un pic homogene et 
unique qui donne lieu a la sequence en acides amines decrite dans la SEQ ID NO: 20, correspondant a la se- 
quence N-terminale du rHV2-Lys 47 mature (Xaa represente les acides amines qui n'ont pas pu etre identifies 
clairement). Ainsi, la coexpression du gene KEX2 produit une proteine heterologue mature et homogene. 

De plus, on determine I'activite inhibitrice du variant rHV2-Lys 47 secrete vis a vis de la thrombine, en uti- 
lisant un test colon metrique (activite proteolytique sur un substrat synthetique, te chromozyme TH, Boehringer 
Mannheim). Le tableau 1 presente les resultats des dosages. L'activite du rHV2-Lys 47 estexprime en ATU/Aeoo 
(1-2 x 10 7 cellules/ml correspondent a 1 unite Aeoonm). 



Tableau 1 


Plasmides 


KEX2 


rHV2-Lys 47 (ATU/Aeoonm) 


PTG6823 
PTG6824 


+ 


8,6 
25,6 



On peut voir que la presence du gene KEX2 dans le plasmide pTG6824 permet une augmentation d'un 
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facteur 3 de ta production de rHN/2-Lys 47 sous forme active. 

EXEMPLE 2 : construction des vecteurs pTG8835 et pTG8836 et production de rHV2-Lys* 7 dans le milieu 
de culture d'une souche de levure transformee par lesdits vecteurs. 

Le vecteur M13TG6807 est soumis a une mutagenese dirigee afin de rempiacer le res id u alanine en po- 
sition +9 de la sequence pro "version longue" de la defensine A par un residu threonine, en mettant en oeuvre 
('oligonucleotide decrit dans la SEQ ID NO: 21. Le phage mute est verifie par sequencage et donne lieu au 
M13TG8832. 

La cassette d'expression comportant le promoteur modif ie du gene MFa1 dirigeant ('expression de la se- 
quence codant pour la sequence pre MFa1, la sequence pro "version longue" (Ala 9 -> Thr) du precurseur de 
la defensine A de Phormia terranovae et rHV2-Lys 47 mature, est isolee de M13TG8832 sous la forme d'un 
fragment Sph\-Sal\. Le fragment purif ie est insere dans le vecteur pTG3828 digere par les enzymes Sph\ et 
Sa/I, donnant lieu au vecteur pTG8835. 

Parallelement, le fragment Sph\-Sal\ purif ie de M13TG8832 est egalement clone entre les sites Sph\ et 
Sa/l du vecteur pTG4812, lequei contient une copie du gene KEX2 de levure. 

On transforme les plasmides pTG8835 et pTG8836 dans les cellules de levure et on analyse les transfor- 
mants obtenus selon le protocol e decrit precedemment. 

Les profils chromatographiques obtenus sont presentes dans les Figures 3A et 3B, correspondent res- 
pectivement aux effluents issus de la culture TGY47.1/pTG8835 et TGY47.1/pTG8836. Les resultats des do- 
sages de I'activite antithombine sont presentes dans le tableau 2 



Tableau 2 


Plasmides 


KEX2 


rHV2-Lys 47 (ATU/Aeoonm) 


PTG8835 
PTG8836 


+ 


10,4 
25,6 



On peut constater que la presence du gene KEX2 dans la construction selon I'invention (pTG8836) reduit 
le nombre de pics generes lors de I'analyse des surnageants de culture par chromatographic et ameliore la 
production de rHV2-Lys 47 active d'un facteur 2,5 fois. Par contre, la mutation de I'alanine en position +9 de ta 
sequence pro du precurseur de la defensine Ad'insecte en threonine, ne produit qu'un effet mineur sur la quafite 
et la quantite de rHV2-Lys 47 produit. 

EXEMPLE 3 : construction des vecteurs pTG8840 et pTG8843 et production de TAla-Pro-trophoblastine 
ovine dans le milieu de culture d'une souche de levure transformee par lesdits vecteurs. 

Le vecteur M1 3TG7720 (Degryse et al, Gene, 1992, 118, 47-53) est digere par les enzymes Hind\ II et Eco- 
Rl puis traite par le grand fragment de I'ADN polymerase I d'E. coli. Le fragment de 0.5kb resultant de ce trai- 
tement, est purif ie sur gel d'agarose et insere dans le vecteur M13TG6807, prealablement digere par Accl et 
traite par le grand fragment de I'ADN polymerase I d'E. coli. On transforme le melange de ligation dans la sou- 
che E coli NM522 et on identifie un phage ayant incorpore le fragment de 0,5kb. Le clone est designe 
M13TG8818. 

Le vecteur M13TG8818 est soumis a une mutagenese dirigee afin d'introduire en amont de la sequence 
codant pour I'extremite N-terminale de la trophoblastine ovine, une sequence codant pour le dipeptide Ala- 
Pro, en mettant en oeuvre ('oligonucleotide decrit dans la SEQ ID NO: 22. Apres mutagenese, la sequence 
des clones generes est verifiee. On choisit un clone contenant la mutation desiree, designe M13TG8834. 

Le vecteur M 1 3TG8834 est a son tour modif ie par mutagenese dirigee, mettant en oeuvre ('oligonucleotide 
decrit dans la SEQ ID NO: 23. La mutagenese permet de generer une jonction correcte entre les sequences 
codantes pour I'extremite 3' de la sequence pro du precurseur de la defensine A de Phormia terranovae et la 
proteine heterologue Ala-Pro-trophoblastine. On identifie un clone mute par sequencage, donnant lieu au vec- 
teur M13TG8838. Ce dernier contient une cassette d'expression composee de la version modifiee du promo- 
teur du gene MFa1 en amont de la sequence codant pour une proteine de fusion composee de la sequence 
pre MFa1 ( la sequence pro du precurseur de la defensine Ade Phormia terranovae (31 acides amines) et r Ala- 
Pro-trophoblastine. 

On digere le vecteur M13TG8838 par I'enzyme EcoRI et on le traite par le grand fragment de I'ADN poly- 
merase I d'E. coli. Le fragment ainsi genere, contenant la cassette d'expression decrite ci-dessus, est purif ie 
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et insert dans le vecteur pTG3828 linearise par SmaL On identifie un transformant ayant integre la cassette 
d'expression dans rorientation correcte par rapport au terminateur PGK. La construction est designee 
pTG8840. 

Parallelement le fragment EcoRl traite de maniere a avoir les extremites tranches et isole de M1 3TG8838, 
5 est egalement insere dans le vecteur pTG4812 linearise par Sma\. On identifie par analyse de restriction, un 
clone presentant la cassette d'expression dans ('orientation correcte vis a vis du terminateur PGK. Le clone 
est appele pTG8843. 

On transforme les vecteurs d'expression pTG8840 et pTG8843 dans la souche de levure TGY47.1, selon 
la methode decrite precedemment. 

w Des transformants de chaque type sont mis en culture en erlenmeyer a 28°C dans un milieu selectif 

(0,67% de YNB sans acide amine, 1% de casamino acides et2% de glucose). Apres 48h de culture, on separe 
les cellules et surnageants par filtration d'une fraction de la culture sur membrane 0,22u.. Le surnageant ob- 
tenu est concentre par ultrafiltration (Centricon YM5, seuil de coupure 5kDa). On soumet un aliquote du f iltrat 
obtenu a une elect rophorese en gel de polyacrylamide-SDS (SDS-PAGE). L'echantillon est chauffe a 95°C 

15 pendant 5min avant d'etre charge sur un gel de polyacrylamide 12,5%. Apres migration, le gel est colore par 
le bleu de Coomassie pour visualiser I'ensemble des proteines (Figure 4). Dans le materiel provenant des le- 
vures transformees par les vecteurs pTG8840 et pTG8843, on visualise un doublet de bandes, Tune a 15kDa 
et I'autre presentant une mob i lite electrophoretique legerement superieure. De plus, on detecte egalement 
d'autres bandes presentant une mo bi lite electrophoretique inferieure, qui ne sont pas non plus presentes dans 

20 l'echantillon correspondant au contr6ie negatif. L'ensemble des bandes specif tquement detectees dans les 
echantillons pTG8840 et pTG8843, est en outre revel e en Western blot par un antiserum de lapin anti- 
trophoblastine ovine. Le materiel de mobilite electrophoretique plus elevee peut etre du a des produits de de- 
gradation de la trophoblastine ou a un artefact d'electrophorese. Par contre, le materiel de mobilite electro- 
phoretique inferieure, reconnu paries anticorps de lapin anti-trophoblastine ovine, peut etre dO a des aggre- 

25 gats proteiques qui peuvent se former rrialgre le traitement des echantillons a 95°C. 

Les bandes formant un doublet a environ 15 a 18 kDa sont transferees sur une membrane PVDF (polyvi- 
nyliden difluoride). On soumet le materiel transfere a une analyse de la sequence en acides amines N-termi- 
naux. On obtient une seule sequence en acides amines decrite dans la SEQ ID NO: 24, qui correspond a la 
sequence attendue pour une proteine heterologue Ala-Pro-trophoblastine et ou Xaa represente les acides ami- 

30 nes qui n'ont pu etre identifies clairement. 

EXEMPLE 4 : vecteurs d'expression de rHV2-Lys 47 dans lesquels la sequence pro de la defensine A 
comprend un residu cysteine en position 2, 6, 9 ou 17. 

35 Le vecteur M13TG6807 est soumis a une mutagenese dirigee afin de remplacer le residu proline en po- 

sition +2 ou Tun des residus alanine en position +6, +9 ou +17 par un residu cysteine. On met en oeuvre les 
oligonucleotides mutagenes decrits respect ivement dans les SEQ ID NO: 25 a. 28. On obtient les vecteurs 
M13TG9836, M13TG9838, M13TG9839 et M13TG9840. 

Un fragment Sph\-Sal\ de 1,4 kb est isole de chacun des vecteurs precedents avant d'etre insere soitdans 

40 le vecteur pTG3828 ou pTG4812 egalement digere par Sph\ et Sa/i. On transforme les vecteurs obtenus dans 
les cellules de levure et on evatue I'activite antithrombine dans les surnageants de culture com me indique pre- 
cedemment. 

Lactivite antitrombine de la rHV2Lys 47 secretee des constructions mettant en oeuvre les variants Cys +2 , 
Cys* 6 , Cys +9 et Cys +17 de la sequence pro defensine A est comparable a cede obtenue avec la sequence pro 
45 de type sauvage. 

Comme precedemment, on observe une production de rHV2-Lys 47 active amelioree d'un facteur 2,5 a 3 
fois dans les constructions derivees de pTG4812 qui incluent le gene KEX2. 

EXEMPLE 5 : construction de vecteurs comprenant la sequence pre BGL2, la sequence pro de la defensi- 
so ne A dans laquelle le residu arginine en position 28 est remplace par un residu proline (Arg 28 -> Pro) et la 
sequence codante pour rHV2-Lys 47 , sous le controle du promoteur modifie du gene MFa1. 

On isole un fragment Psfl de M13TG4815. Celui-ci comprend le promoteur MFa1 modifie mais incluant 
en outre un site Xho\ en position -12 par rapport a I'ATG initiateur (Xho\-M) suivi de la sequence pre BGL2, 
55 de la sequence pro MFa1 et de la sequence synthetique codant pour la defensine Ade Phormia terranovae. 
La sequence pre BGL2 est decrite dans Klebl et Tanner, (J. Bacteriol., 1989, 171. 6259-6264).Ce fragment 
Pst\ de 768pb qui porte le promoteur MFa1 tel que decrit ci-dessus ainsi que les 8 premiers acides amines de 
la sequence pre BGL2 t est sous clone dans le vecteur M13TG4813 digere par Pst\. II en resulte M13TG5871. 
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On isole le fragment Sph\-BamH\ de M13TG5871 comprenant le promoteur MFa1 (X/iol-12), une sequen- 
ce pre de fusion composee des residus 1 & 8 de la sequence pre BGL2 et des residus 8 d 18 de la sequence 
MFa1, la sequence pro MFa1 et le gene synthetique defensine A. Ce fragment est introduit dans pTG3828 
egalement traite par les enzymes Sph\ et SamHI pour donner pTG5885. 

Par ailleurs, le vecteur M1 3TG6801 f deja mentionne. est soumis a une mutagenese dirigee af in de generer 
la version tongue (acides amines +1 & +31) de la sequence pro de la defensine A d I'aide de ('oligonucleotide 
OTG3051 (SEQ ID NO: 29). Par la meme occasion, on introduit un site Nhe\ en 3' de la sequence pre MFa1 . 
On obtient pTG6820. On introduit le fragment Sph\-BamH\ purifie de pTG6820 entre les memes sites de 
pTG3828, pour generer pTG6821 . 

pTG5885 est digere par les enzymes Xho\ et Sa/I puis lige en presence de deux fragments. Tun Xhoi-Nhe\ 
provenant de la rehybridation des oligonucleotides synthetiques OTG3070 et OTG3071 (SEQ ID NO: 30 et 
31) et ('autre Nhe\-Sal\ isole de pTG6821 et correspondant d I'extremite 3' de la sequence pre de la defensine 
A, la sequence pro (version longue) et la sequence de la defensine A mature. On obtient pTG6880. 

D'autre part le vecteur pTG3828 est digere partiellement par Xoal, traite par le grand fragment Klenow 
de TADN polymerase I d'E. coli avant d'6tre religue, donnant lieu d pTG6888 dans lequel le site Xoal situe 
dans le 2p. est detruit. Celui-ci est digere par Sph\ et BamHI, sites entre lesquels on introduit le fragment Sph\- 
SamHI isole de M13TG8883. Ce dernier comprend une cassettte d'expression composee du promoteur mo- 
difie du gene MFa1, dirigeant ('expression d'un precurseur "sequence pre BGL-2, sequence pro MFa1, se- 
quence codant pour la proteine mature OspA" (Bergstrom et ai., Mol Microbiol., 1 989, 3, 479-486). On obtient 
pTG8890. 

On amplif ie par PCR a partir de la matrice pTG8890 et des amorces OTG4442 et OTG4443 (SEQ ID NO: 
32 et 33) un fragment portant le promoteur modif ie du gene MFa1 suivi de la sequence pre BGL2. 

Parallelement on amplif ie, egalement par PCR, un fragment comportant la sequence pro de la defensine 
A £ partir de pTG6880 et des amorces OTG4444 (SEQ ID NO: 34) et OTG4445 (SEQ ID NO: 35). Les amorces 
permettent d'introduire egalement des mutations silencieuses pour generer un site Eagl pres de I'extremite 
3' de la sequence pro et un site Kpn\ au deia de cette extremite. Puis on assemble les deux fragments PCR 
pour former un fragment lineaire Sph\-Kpn\ par un double PCR £ I'aide des oligonucleotides OTG4442 (SEQ 
ID NO: 32) et OTG 4445 (SEQ ID NO: 35). II est insere dans le vecteur M13TG131 egalement traite par Sp/il 
et Kpn\ pour donner M13TG8898. 

On soumet celui-ci a une mutagenese dirigee pour corriger une mutation A-> G en position -5 par rapport 
a I'ATG initiateur. On met en oeuvre ('oligonucleotide OTG4637 (SEQ ID NO: 36) pour generer M13TG9800. 

On isole par PCR la sequence codante pour rHV2-Lys 47 , munie d'une extension N-terminale correspon- 
dant aux derniers acides amines de la sequence pro de la defensine A, dont les codons codant pour les residus 
en position 27 et 28 ont ete modifies silencieusement de maniere a introduire un site de restriction Eagl. D'au- 
tre part, on introduit en 3* du codon stop de rHV2-Lys 47 un site Sa/I. On utilise & titre de matrice le vecteur 
M13TG6807 et les deux amorces OTG5074 et OTG5075 reportees dans les SEQ ID NO: 37 et 38. 

On introduit le fragment Eag\~Sal\ genere par PCR entre les memes sites de M13TG 9800. On obtient 
M13TG9853 lequel est digere par Sa/l puis traite par le grand fragment de J'ADN polymerase I d'E. cofi, avant 
d'etre relige sur lui-meme (destruction du site Sa/I). On genere M13TG9854. 

Ce dernier est dive par Eagl etyAccI puis ligue £ un adaptateurconstituedes 2 oligonucleotides OTG5136 
et OTG5137 rehybrides (SEQ ID NO: 39 et 40). Apres transformation du melange de ligation dans E. coli, on 
isole quelques clones dont on verif ie la sequence par les techniques standards. On selectionne un clone dont 
(a sequence est correcte, designe ci-apres M13TG9856. 

On isole le fragment Sph\-Bgl\\ de 1,4 kb de M13TG9856 lequel est insere entre les sites Spril et Sg/ll de 
pTG3828 ou Sph\ et BamHI de pTG4812, pour donner respectivement pTG9860 et pTG9863. 

Comme precedemment, apres transformation de ces 2 vecteurs d'expression dans la souche de levure 
TGY47.1, on determine I'activite antithrombine de I'hirudine rHV2-Lys 47 secretee dans le surnageant des 
cultures correspondantes. L'actPvite mesuree a partir des constructions comprenant la sequence pro (Arg 28 - 
> Pro) de la defensine A est comparable d celle obtenue avec les vecteurs incluant une sequence pro de type 
sauvage. On observe egalement une amelioration d'un facteur 3 lorsque le vecteur inclut le gene KEX2 
(pTG9863 versus pTG9860). 

EXEMPLE 6 : construction du vecteur pTG8709 et production de la xenoxine-1 dans le milieu de culture 
d'une souche de levure transformee par ledit vecteur. 

On amplifie par PCR la sequence codant pour la xenoxine-1 mature munie d'un site Eagl en 5' et d'un 
site Sa/I en 3'. On utilise 6 titre de matrice M13TG4414 ou pTG4414 (Kolbe et al., J. Biol. Chem., 1993, 268, 
16458-16464) et les amorces OTG5770 et OTG5771 (SEQ ID NO: 41 et 42). Le fragment ainsi genere est in- 
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tegre dans M13TG9800 prealablement digere par Eag\ et Sa/I pour donner M13TG8703. Celui-ci comprend 
une cassette d'expression composee du promoteur MFa1 modifie dirigeant I'expression d'un precurseur "se- 
quence pre BGL2, sequence pro MFat, sequence codant pour la xenoxine-1 mature". La sequence en acide 
amine de cette derniere est indiquee dans ta SEQ ID NO: 43. 

5 On introduit le fragment Sph\-Sal\ isole de M1 3TG8703 et portant la cassette d'expression entre les meme 

sites de pTG4812. On obtient pTG8709 qui esttransforme dans la souche S. cerevisiae TGY73.4 laquelle de- 
rive de TGY47.1 mais presente une prototrophie pour la leucine (Leu"). On selectionne un transformant 
Ura + que Ton fait pousser en milieu selectif (decrit dans Texemple 1) pendant 60 heures. Le surnageant de 
culture est concentre par ultrafiltration sur membrane YM2 et centrif ugation selon les techniques convent ion- 

10 nelles. Le concentre est soumis a une electrophorese denaturante sur gel de polyacrylamide (15,3 % en po- 
lyacrylamide). Les proteines sont transferees sur membrane PVDF et le materiel correspondant au poids mo- 
leculaire attendu (environ 7kDa) est soumis a un sequencage des acides amines N-terminaux. On lit une se- 
quence, presente en quant ite majoritaire, qui correspond a la sequence N-terminale attendue pour la xenoxine- 
i mature ; (SEQ ID NO: 44 ; Xaa re presente les acides amines qui n'ont pas pu etre identifies clairement). 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERALE: 

U) DEPOSANT: 

(A) NOM: Transgene S.A. 

(B) RUE: 11 rue de Molsheim 

(C) VILLE: Strasbourg 

(E) PAYS: France 

(F) CODE POSTAL: 67000 

(G) TELEPHONE: (33) 88 27 91 00 

(H) TELECOPIE: (33) 88 22 58 07 

(li) TITRE DE L' INVENTION: Nouvelle sequence pro permettant la 

secretion de proteines heterologues a partir d'une cellule de 
levure. 

(ili) NOMBRE DE SEQUENCES: 4 4 

{iv} FORME LISIBLE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Tape 
(BJ ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 

(vi) DONNEES DE LA DEMANDE ANTERI EURE : 

(A) NUMERO DE DEPOT: FR 90 00171 

(B) DATE DE DEPOT: ll-JAN-1993 

(2) INFORMATION POUR LA SEQ ID NO: 1: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 acides amines 

( B ) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE: NON 

tiii) ANTI-SENS: NON 

(v) TYPE DU FRAGMENT: interne 

(vi) ORIGINE: 

(A) ORGANISME: sequence pro de la defensine A 

(B) SOUCHE: Phormia terranovae 

45 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

lie Xaa Ala Asp Ala Xaa Asn Asp Xaa His Phe Val Asp Gly Val Gin 
1 5 10 15 

Xaa Leu Lys Glu lie Glu Pro Glu Leu His Gly Xaa Tyr Xaa Arg 
50 20 25 30 
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(2) INFORMATION POUR LA SEQ ID NO: 2: 

(ij CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 31 acides amines 

(B) TYPE: acide amine 
(D) CONFIGURATION: Iineaire 

<ii) TYPE DE MOLECULE: peptide 

10 (iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi TYPE DU FRAGMENT: interne 

15 (vi> ORIGINE: 

(A) ORGANISME: sequence pro de la defensine A de Phormia 

terranovae 

(B) SOUCHE: Phormia terranovae 

20 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

lie Pro Ala Asp Ala Ala Asn Asp Ala His Phe Val Asp Gly Val Gin 
15 10 15 

Ala Leu Lys Glu lie Glu Pro Glu Leu His Gly Arg Tyr Lys Arg 
25 20 25 30 

(2) INFORMATION POUR LA SEQ ID NO: 3: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 1 paires de bases 

( B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS : simple 

(D) CONFIGURATION : Iineaire 

(ii) TYPE DE MOLECULE: ADN tgencmique) 

Uii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(B) SOUCHE: Phormia terranovae 

{O INDIVIDUEL ISOLE: oligonucleotide de recons titution du 
gene defensine A 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

AGCTTGGACA AGAGAGCTAC CTGTGACTTG TTGTCCGGTA C 41 

(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
50 (A) LONGUEUR: 20 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 
5 (ii) TYPE DE MOLECULE: ADN ( genomique ) 

(iii) HYPOTHETIQUE: NON 
fiii) ANTI-SENS: OUI 

10 (vi) ORIGINE: 

(B) SOUCHE: Phormia terranovaea 

(C) INDIVIDUEL ISOLE: oligonucleotide de reconstitucion du 

gene defensine A 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
ACAGGTAGCT CTCTTGTCCA 20 
(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 13 paires de bases 

(B) TYPE: acide nucleique 
<C) N OMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: OUI 

(vi) ORIGINE: 

(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de recons titution du 

gene defensine A 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
CGGACAACAA GTC 13 
(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 40 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de recons titution du 
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gene defensine A 

5 ixi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

CGGTATTAAC CACTCCGCTT GTGCTGCTCA CTGTTTGTTG 4 0 

(2) INFORMATION POUR LA SEQ ID NO: 7; 

10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 29 paires de bases 
(B> TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

15 (ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE : NON 
(iii) ANTI-SENS: OUI 
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{vi> ORIGINE: 

(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de reconstituion du 

gene defensine A 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ I D NO: 7: 
AGCACAAGCG GAGT GGTTAA TACCGGTAC 2 9 

(2) INFORMATION POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 38 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN ; genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de recons ti tut ion du 

gene defensine A 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

AGAGGTAACA GAGGTGGCTA CTGTAACGGT AAGGGTGT 3 8 

(2) INFORMATION POUR LA SEQ ID NO: 9: 

(ii CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 37 paires de bases 
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(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genamique) 

(iii) HYPOTHETIQUE: NON 

iiii) ANTI-SENS: OUI 

(vi) ORIGINE: 

{ B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de reconstitution du 
gene defensine A 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 9: 
AGTAGCCACC TCTGTTACCT CTCAACAAAC AGTGAGC 37 
(2) INFORMATION POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomiquej 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(BJ SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonuclotide de recons tituion du 
gene defensine A 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
TTGTGTTTGT AGAAACTAAG GATCCG 2 6 

(2) INFORMATION POUR LA SEQ ID NO: 11: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 46 paires de bases 
(BJ TYPE: acide nucleique 
(C) NOMBRE DE BRINS: simple 
45 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

50 (iii) ANTI-SENS: OUI 

(vi) ORIGINE: 
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(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de reconstitution du 

gene defensine A 

5 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
AATTCGGATC CTTAGTTTCT ACAAACACAA ACACCCTTAC CGTTAC 4 6 

10 (2) INFORMATION POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 37 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 
15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

20 (iii) ANTI-SENS: NON 

<vi) ORIGINE: 

(C) INDIVIDUEL I SOLE : oligonucleotide de mutagenese 

25 (xi ) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 12: 

T C G C AG CAT C CTCCGCGCTA GCTGCTCCAG TCAACAC 3 7 

(2) INFORMATION POUR LA SEQ ID NO: 13: 

30 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

35 (ii) TYPE DE MOLECULE: ADN (genomique) 

Uii) HYPOTHETIQUE: NCN 
(iii) ANTI-SENS: OUI 
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(vi> ORIGINE: 

(C) INDIVIDUEL I SOLE : oligonucleotide de mutagenese 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

ATGTTGCTCT CTTGTCAAAG CTTTGTAATC CTTGGC 36 

(2) INFORMATION POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 38 paires de base^ 
{B) TYPE: acide nucleique 
(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

ivi) ORIGINE: 

(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL ISOLE: oligonucleotide de reconstitution de 

la sequence pro courte 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
CTAGCTGCCA AC GAT G C AC A TTTTGTTGAT GGCGTTCAGG CTTTAAAAGA AATTGAACCC 60 
GAATT AC AT G GCCGTTACAA GAGAGCAA 38 
(2) INFORMATION POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 88 paires de bases 

(B) TYPE: acide nucleique 
<C) N OMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: OUI 

(vi) ORIGINE: 

(B) SOUCHE: Phormia terranovae 

(C) INDIVIDUEL I SOLE : oligonucleotide de reconstitution de 

la sequence pro courte 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 
CATGTTGCTC TCTTGTAACG GCCATGTAAT TCGGGTTCAA TTTCTTTTAA AGCCTGAACG 60 
CCATCAACAA AATGTGCATC GTTGGCAG 8 8 

(2) INFORMATION POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 4 5 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 
^ (iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 
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(vi) ORXGINE: 

<C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
TCCTCCGCGC TAGCTATTCC TGCTGATGCT GCCAACGATG CACAT 4 5 

(2) INFORMATION POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 45 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
<D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN igenomique) 

!iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

GGCCGTTACA AGAGAATTAC GTATACAGAC GCAACATGTG ATTTA 4 5 

(2) INFORMATION POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
30 (A) LONGUEUR: 11 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(11) TYPE DE MOLECULE: peptide 
35 f i i i ) H Y POTHET I QUE: NON 

<v) TYPE DU FRAGMENT: N-terminal 
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( vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: sequencage N-term du materiel 
TGY47 . l/pTG6823 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

lie Thr Tyr Thr Xaa Xaa Thr Glu Ser Gly Gin 
15 10 

(2) INFORMATION POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 11 acides amines 
(3) TYPE: acide amine 
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(D> CONFIGURATION: lineaire 

5 (ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE: NON 

(v) TYPE DU FRAGMENT: N-terminal 

10 (vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: sequencage du materiel de la culture 
TGY47.1/pTG6823 



15 



20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

Tyr Xaa Xaa lie Thr Tyr Thr Asp Xaa Thr Glu 
15 10 

(2) INFORMATION POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 15 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

25 (ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE: NON 

(v) TYPE DU FRAGMENT: N-terminal 

30 (vi) ORIGINE: 

(C) INDIVIDUEL I SOLE : sequencage du materiel de la culture 

TGY47 . l/pTG6824 



35 
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(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 

lie Thr Tyr Thr Asp Xaa Thr Glu Ser Gly Gin Asn Leu Xaa Leu 
15 10 15 

(2) INFORMATION POUR LA SEQ ID MO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 33 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
50 (iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
GATGCTGCCA AC GAT AC ACA TTTTGTTGAT GGC 33 
(2) INFORMATION POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 39 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
<iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

<vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
GTTACAAGAG AATTACGTGC TCCATGTTAC CTATCTCAG 39 
(2) INFORMATION POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

( D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
CATGGCCGTT ACAAGAGAGC TCCATGTTAC CTATCT 
(2) INFORMATION POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 13 acides amines 

(B) TYPE: acide amine . 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 
( iii ) HYPOTHETIQUE: NON 
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(v) TYPE DU FRAGMENT : N- terminal 
( vi) ORIGINE: 

(C) INDIVIDUEL ISOhZi sequencage du materiel de la culture 
TGY47. l/pTG8840 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 

Ala Pro Xaa Tyr Leu Ser Gin Arg Leu Met Leu Asp Ala 

15 10 

(2) INFORMATION POUR LA SEQ ID NO: 25: 



15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paixes de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
( iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISMS: OTG4364 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese {pro 
def A Pro2 -> Cys ) 

(vii) SOURCE IMMEDIATE: 

(B) CLONE: M13TG9836 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 

35 TCCGCGCTAG CTATTTGTGC TGATGCTGCC AA 

:2) INFORMATION POUR LA SEQ ID NO: 26: 

<i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 32 paires de bases 
40 (B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

45 (iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISME: OTG4365 
50 (C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese (sequ 

pro def A Ala6 -> Cys) 

(vii) SOURCE IMMEDIATE: 

55 
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(3) CLONE: M13TG9838 

5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 

ATTCCTGCTG ATGCTCTTAA CGATGCACAT TT 32 
(2) INFORMATION POUR LA SEQ ID NO: 27: 

10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 panes de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

15 <ii) TYPE DE MOLECULE: ADN i genomique ) 

(iii) HYPOTHETIQUE: NOW 

(iii) ANTI-SENS: NON 

20 (vi) ORIGINE: 

(A) ORGANISME: OTG4866 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 
(sequence pro def A Ala9->Cys) 

(vii) SOURCE IMMEDIATE: 
25 (B) CLONE: M13TG9839 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 
GATGCTGCCA ACGATTGTCA TTTTGTTGAT GGC 33 
(2) INFORMATION POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
(DJ CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 



(vi) ORIGINE: 

(A) ORGANISME: OTG4867 

45 (C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese (sequ 

pro def A Alal7 -> Cys) 

(vii) SOURCE IMMEDIATE: 

(B) CLONE: M13TG9840 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
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GTTGATGGCG TTCAGTGTTT AAAAGAAATT GAA 33 
(2) INFORMATION POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 45 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 



( vi) ORIGINE: 

(A) ORGANISME: OTG30S1 

(C) INDIVIDUEL ISOLE: oligonucleotide de mutagenese 

20 (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 29: 

TCCTCCGCGC TAGCTATTCC TGCTGATGCT GCCAACGATG CACAT 4 5 

(2) INFORMATION POUR LA SEQ ID NO: 30: 

25 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 75 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

30 (ii) TYPE DE MOLECULE: ADN (genomique) 

( iii i HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(Ai ORGANISME : OTG307 0 

(C) INDIVIDUEL ISOLE: oligonucleotide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 
TCGAGTAAAA GAATGAAATT CTTCATGGTA TTCGTTGTTA CTTTCTGCTT AGCAGTTTGT 60 
TTTGTCTCCC AATCG 75 
45 (2) INFORMATION POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 75 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
50 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(iii) HYPOTHETIQUE : NON 

(iii) ANTI-SENS: OUI 

(vi) ORIGINS: 

(A) ORGANISME: CTG3071 

(C) INDIVIDUEL ISOLE: oligonucleotide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 
CTAGCGATTG GGAGACAAAA CAAACTGCTA AG CAG AAAGT AACAACGAAT AC CAT G AAGA 60 

75 

ATTTCATTCT TTTAC 

(2) INFORMATION POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 36 paires de bases 
(3) TYPE: acide nucleique 

(C) N OMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISME: OTG4442 

(C) INDIVIDUEL ISOLE: amorce PCR d * un fragment "prom 
MFalphal-sequ pre BGL2" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
CTCGATATCG CATGCTATTG ATAAGATTTA AAGGTA 36 
(2) INFORMATION POUR LA SEQ ID NO: 33: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 38 paires de bases 

(B) TYPE: acide nucleique 

40 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii ) HYPOTHETIQUE: NON 

45 

(iii) ANTI-SENS: OUI 

(vi) ORIGINE: 

(A) ORGANISME: OTG4443 

(C) INDIVIDUEL ISOLE: amorce PCR pour un fragment "prom 
50 MFalphal-sequ pre BGL2" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

TGTGCATCGT TGGCAGCATC AGCAGGAATA GCTGAAAC 38 

(2) INFORMATION POUR LA SEQ ID NO: 34: 

(i) CARACT ERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 59 paires de bases 
<B) TYPE: acide nucleique 
(C) N OMBRE DE BRINS: simple 
{ D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(i.li) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 



(vi) ORIGINE: 

(A) ORGANISME: OTG4444 

(B) SOUCHE: amorce PCR pour isoler sequence pro def A (site 
20 EagI) 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 
CTATTTTTCA CAGCCTCCCA AGTTTCAGCT ATTCCTGCTG ATGCTGCCAA CGATGCACA 5 9 

(2) INFORMATION POUR LA SEQ ID NO: 35: 



(i) CARACT ERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 45 paires de bases 

(B) TYPE: acide nucleique 
30 (C) NOMBRE DE BRINS: simple 

( D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: OUI 

(vi) ORIGINE: 

(A) ORGANISME: OTG4445 

(B) SOUCHE: amorce PCR pour isoler sequence pro def A (sice 
EagI) 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 

AAGCTAAGTG GTACCTCTCT TGTAACGGCC GTGTAATTCG GGTTC 4 5 

(2) INFORMATION POUR LA SEQ ID NO: 36: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 21 paires de bases 
( B > TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
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( D) CONFIGURATION : Iineaire 
(ii) TYPE DE MOLECULE: ADN (genomique) 

5 

(iii) HYPOTHETIQUE: NON 

[iii) ANTI-SENS: NON 

(vi) ORIGINS: 
10 (A) ORGANISME: OTG4 637 

(C> INDIVIDUEL ISOLE: oligonucleotide de mutagenes< 
(correction mutation prom MF1 ) 



(vii) SOURCE IMMEDIATE: 

(B) CLONE: M13TG9800 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 
TAAACGATTA AAAGAATGCG T 21 
(2) INFORMATION POUR LA SEQ ID NO: 37: 

(ii CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 42 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS : simple 
25 (D) CONFIGURATION: Iineaire 

tii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

1 vi) ORIGINS: 

(A) ORGANISME: OTGS07 4 
(C) INDIVIDUEL ISOLE: amorce PCR 

ixi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 
G CAT GAT C CT CGGCCGTTAC AAGAGAATTA CGTATACAGA CT 42 
40 (2) INFORMATION POUR LA SEQ ID NO: 38: 

(ii CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 43 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMB RE DE BRINS: simple 
45 (D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

50 (iii) ANTI-SENS: OUI 

(vi) ORIGINE: 
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(A) ORGAN I SME : OTG5 0 7 5 
(C) INDIVIDUEL ISOLE: amorce PCR 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38 
GATGCTGTGA GTCGACCATT TTTCATTGTA AATATTCTTC TGG 
(2) INFORMATION POUR LA SEQ ID NO: 39: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISME: OTG5136 

(C) INDIVIDUEL ISOLE: adaptateur 

25 ( X i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39 

G G C C CAT AC A AGAGAATTAC GT 
(2) INFORMATION POUR LA SEQ ID NO: 40: 

30 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

35 (ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: OUI 
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(vi) ORIGINE: 

(A) ORGANISME: OTG5137 

(C) INDIVIDUEL ISOLE: adaptateur 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40 
AT AC GTAATT CTCTTGTATG 

(2) INFORMATION POUR LA SEQ ID NO: 41: 

50 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 5 paires de bases 

(B) TYPE: acide nucleique 
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(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISME: OTG577 0 

(C) INDIVIDUEL ISOLE: amorce de PCR 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41 
TACGTCGGCC GTTACAAGAG ACTGAAATGT GTGAATTTAC AAGCG 
(2) INFORMATION POUR LA SEQ ID NO: 42: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: OUI 

(vi) ORIGINE: 

(A) ORGANISME: OTG5771 

(C) INDIVIDUEL ISOLE: amorce de PCR 

txi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42 

AGTTTGTCGA CTCAAGCATT GCACATGTTT CCT 

(2) INFORMATION POUR LA SEQ ID NO: 43: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 66 acides amines 
{ B ) TYPE: acide amine 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: proteine 
45 (iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Xenoxine 

(B) SOUCHE: Xenopus laevis 

50 (ix) CARACTERI ST I QUE ADDITIONELLE : 

(A) NOM/CLE: Protein 
{ B) EMPLACEMENT: 1 . . 61 



55 



29 



BNSDOCID:<EP 0607080A1> 



EP 0 607 080 A1 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43: 

Leu Lys Cys Val Asn Leu Gin Ala Asn Gly lie Lys Met Thr Gin Glu 
15 10 15 

Cys Ala Lys Glu Asp Thr Lys Cys Leu Thr Leu Arg Ser Leu Lys Lys 
20 25 30 

Thr Leu Lys Phe Cys Ala Ser Gly Arg Thr Cys Thr Thr Met Lys He 
35 40 45 

Met Ser Leu Pro Gly Glu Gin He Thr Cys Cys Glu Gly Asn Met Cys 
50 55 60 

Asn Ala 

65 

(2) INFORMATION POUR LA SEQ ID NO: 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 15 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 
(iii) HYPOTHETIQUE: NON 

(v) TYPE DU FRAGMENT: N-terminal 
(Vi) ORIGINE: 

(C) INDIVIDUEL ISOLE: sequencage du materiel de la culture 

TGY73 . 4/pTG8709 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 44: 

Leu Lys Xaa Val Asn Leu Gin Ala Asn Gly He Lys Met Xaa Gin 
15 10 15 



Revendications 

1. Une cassette d'expression permettant ta synthese d'une proteine heterologue mature, comprenant au 
moins un fragment d'ADN codant pour un precurseur de ladite proteine heterologue ; ledit precurseur 
comprenant : 

- une sequence pre fonctionnelle dans ta levure, 

- la sequence pro du precurseur de la defensine A de Phormia terranovae, un variant ou un fragment 
fonctionnel de celle-ci, et 

- une sequence correspondant a celle de ladite proteine heterologue sous forme mature ; 
ledit fragment d'ADN etant sous le controle des elements necessaires a son expression. 

2. Une cassette d'expression selon la revendication 1, caracterisee en ce que le fragment d'ADN code pour 
un precurseur comprenant une sequence pre qui est celle du precurseur du facteur a de la levure Sac- 
charomyces cerevisiae. 

3. Une cassette d'expression selon la revendication 1 ou 2, caracterisee en ce que la sequence pro a une 
sequence en acides amines telle que montree dans la SEQ ID NO: 1 , debutant a I'acide amine en position 
+ 1 ou +6 et se terminant a I'acide amine +31, dans laquelle, ensemble ou separement, le residu Xaa en 
position +2 est un residu proline ou cysteine, le residu Xaa en position +6 est un residu alanine ou cysteine, 
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ie residu Xaa en position +9 est un residu alanine cysteine ou threonine, le residu Xaa en position +17 
est un r6sidu alanine ou cysteine, le residu Xaa en position +28 est un residu arginine ou proline et le 
residu Xaa en position +30 est un r6sidu arginine ou lysine. 

4. Une cassette d'expression selon Tune des revendications 1 a 3, caracterisee en ce que la sequence pro 
a la sequence en acides amines telle que montree dans la SEQ ID NO: 2. 

5. Une cassette d'expression selon Tune des revendications 1 a 4, caracterisee en ce que le fragment d'ADN 
comporte une sequence correspondant a celle de Thirudine. 

6. Une cassette d'expression selon la revendication 5, caracterisee en ce que le fragment d'ADN comporte 
une sequence correspondant a celle du variant rHV2-Lys 47 de Thirudine. 

7. Une cassette d'expression selon I'une des revendications 1 a 4, caracterisee en ce que le fragment d'ADN 
comporte une sequence correspondant a celle de la trophoblastine ovine comprenant a son extremite 
5' une extension constitute par le dipeptide Ala-Pro. 

8. Une cassette depression selon I'une des revendications 1 a 4, caracterisee en ce que le fragment d'ADN 
comporte une sequence correspondant a celle d'un peptide de la famille des xenoxines. 

20 9. Une cassette d'expression selon I'une des revendications 1 a 8, caracterisee en ce que ladite cassette 
d'expression comprend en outre un terminateur de transcription fonctionnel dans la levure. 

10. Un vecteur d'expression comprenant une cassette d'expression selon I'une quelconque des revendica- 
tions 1 a 9. 

11. Un vecteur d'expression selon la revendication 10, caracterise en ce qu'il comprend en outre une ou plu- 
sieurs copies de tout ou partie du gene KEX2. 

12. Une souche de levure comprenant une cassette d'expression selon I'une quelconque des revendications 
1 a 9 ou un vecteur d'expression selon la revendication 10 ou 11. 

13. Une souche de levure selon la revendication 12, caracterisee en ce que ladite souche est sSlectionnSe 
parmi les levures Saccharomyces cerevisiae, Hansenula polymorpha, Pichia pastoris et Kluyveromyces 
lactis. 

14. Procede de preparation d'une proteine heterologue, selon lequel : 

- on cultive une levure selon la revendication 12 ou 13 dans un milieu approprie et, 

- on recupere la proteine heterologue dans ie milieu de culture sous forme mature. 

15. Proteine obtenue par la mise en oeuvre d'un procede selon la revendication 14. 
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Figure 1 



Hind m Kpn I 

M OUgo 1 — 

f 

AGC TTG GAG AAG AGA GCT ACC TGT GAC TTG TTG TCC QSL 
Sex Leu Asp Lys Arg Ala Thr Cys Asp Leu Leu Ser Gly 
AC CTG TTC TCT CGA TGG ACA CTG AAC AAC AGG CCA 

^ 01igo2 »» *m OHgo3 ». 



-m~m OUgo 4 

ACC GGT ATT AAC CAC TCC GCT TGT GCT GCT CAC TGT TTG 
Thr Gly He Asn His Ser Ala Cys Ala Ala His Cys Leu 
TGG CCA TAA TTG GTG AGG CGA ACA CGA CGA GTG ACA AAC 

OUgo 5 ■> 



<4 OUgo 6 

TTG AGA GGT AAC AGA GGT GGC TAC TGT AAC GGT AAG GGT 
Leu Arg Gly Asn Arg Gly Gly Tyr Cys Asn Gly Lys Gly 

AAC TCT CCA TTG TCT CCA CCG ATG ACA TTG CCA TTC CCA 

OUgo 7 

* Bam HI Eoo R2 
OUgo 8 s> 

GTT TGT GTT TGT AGA AAC TAA GGATCCG 

Val Cys Val Cys Arg Asn End 

CAA ACA CAA ACA TCT TTG ATT CCTAGGCTTAA 

OUgo 9 » 
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Figure 3 
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